طراحی و پیاده‌سازی یک سیستم بازیابی اسناد چاپی فارسی

author

  • زهرا بهمنی مربی، مهندسی کامپیوتر، دانشگاه صنعتی خاتم‌الانبیاء بهبهان
Abstract:

هدف: معرفی، دسته‌بندی، و نقد پژوهش‌‌ها دربارۀ سیستم‌های بازشناسی و بازیابی اسناد چاپی فارسی و پیشنهاد یک سیستم بازیابی اسناد چاپی با رویکردی نو. روش‌شناسی: شیوه‌ای جدید با رویکرد جداسازی، طراحی و سپس پیاده‌سازی شده است. برای آموزش و آزمایش سیستم، پایگاه داده‌ای شامل تصویر 50 صفحه متن فارسی در 5 قلم مختلف فراهم آمد. از نیمی از این داده‌ها برای آموزش و نیمی دیگر برای آزمایش سیستم استفاده شد. یافته‌ها: سیستم‌های بازشناسی یا بازیابی سند چاپی فارسی از یکی از سه رویکرد مبتنی بر جداسازی، مبتنی بر شکل کلی کلمه، و رویکرد ترکیبی پیروی می‌کنند. این پژوهش یک سیستم مبتنی بر جداسازی پیشنهاد و پیاده‌سازی و نتایج ارائه شده است. نتیجه‌گیری: نتایج نشان می‌دهد نظام پیشنهادی، روش مناسبی برای پیاده‌سازی نظام‌های بازشناسی یا بازیابی اسناد فارسی است.

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

بازیابی بر اساس محتوای اسناد چاپی فارسی

با افزایش کتابخانه های دیجیتال و برای برای دستیابی به هدف ادارات بدون کاغذ تعداد زیادی از کپی ها به دیجیتال تبدیل شده و در سیستم مدیریت اسناد ذخیره شده است. همچنین در حال حاضر میلیون ها سند دیجیتال دائماً بر روی اینترنت از یک نقطه به نقطه ی دیگر منتقل می شوند. اگر چه تکنولوژی پردازش تصویر اسناد می تواند برای تبدیل اتوماتیک تصاویر دیجیتال این اسناد به فرمت متن قابل خواندن به وسیله کامپیوتر با اس...

15 صفحه اول

طراحی و ارزیابی یک سیستم کدکننده/کدگشا برای فشرده سازی تصاویر اسناد متنی چاپی

در این رساله، یک سیستم جامع کدکننده/کدگشا مبتنی بر مدل محتوای مخلوط شده در راستا (mrc) برای فشرده سازی با اتلاف اسناد چاپی و با تأکید بر ویژگیهای رسم الخط فارسی/عربی ارائه می گردد. این سیستم قابل انعطاف (تنظیم) بوده و برای تحقق آن بایستی موارد زیر لحاظ شوند: نیاز به ارتباط مناسب بلوکهای عملیاتی مختلف، روشی برای فشرده سازی تصاویر (متنی) دودویی، روشی برای جداسازی متن از پس زمینه ی آن، فنونی به من...

15 صفحه اول

طراحی و پیادهسازی سیستم یادآور واکسیناسیون کودکان مبتنی بر سرویس پیام کوتاه

Background: Most problems related to quality of care and patient safety are related to human negligence. One of the causes of these problems is forgetting to do something. This problem can be avoided with information technology in many cases. Some forgotten are very important. Among these is failure to comply with vaccination schedule by parents that can result in inappropriate outcomes. In thi...

full text

بازیابی متون چاپی فارسی بر اساس پرس و جوی کلمات

در این پایان نامه روشی جدید برای بازیابی و جستجوی کلمات فارسی از میان متون تصویری فارسی ارائه شده است. همچنین روشی مبتنی بر اندازه و شکل نقاط موجود در مستند پس از آستانه گذاری، جهت تشخیص قلم و اندازه قلم مستندات تصویری فارسی ارائه شده است. روش ارائه شده برای تشخیص قلم از اولین روش هایی می باشد که می تواند با دقت بسیار بالایی اندازه قلم مستند فارسی را هم تشخیص دهد. برای ارزیابی روشهای ارائه شده ...

15 صفحه اول

طراحی و پیادهسازی یک الگوریتم برچسبزنی دستوری کلمات فارسی و تشخیص ساختار گروههای دستوری

این پایان نامه در مورد برچسب زنی کلمات و قطعه بندی عبارات در زبان فارسی می باشد.

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


Journal title

volume 30  issue 4

pages  58- 70

publication date 2020-01-21

By following a journal you will be notified via email when a new issue of this journal is published.

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023